干货:那些年火到现在的倾向值匹配法
作者:阜外心血管病医院 姚佑楠
BMJ在2016年年底发表了一篇关于吡格列酮是否会增加2型糖尿病患者膀胱癌发生风险的大型队列研究,该研究方法中应用了倾向值匹配法(PSM)。那么倾向值匹配法是什么东东呢?
众所周知,随机对照试验(RCT)能提供高等级的证据。然而,并不是所有的问题都能通过RCT来解决。例如要探讨大学教育会不会影响收入,你不能找一群考上大学的高三毕业生随机分成两组,一组上大学,一组不上大学,待四年之后前瞻性观察两组的收入吧?(要是我考上清华北大,却被分到不上大学那组,多不人道啊!)因此有些研究问题不得不使用观察性研究方法。
但是,观察性研究不可避免的会存在选择偏倚,例如上大学的人在某些方面(例如学习能力)和没上大学的人存在差异,这些差异对研究终点(收入)又可能产生影响。为解决这一窘境,倾向值分析(匹配是其中的一种)应运而生,并最早应用于社会学研究,后来又进一步应用于医学领域。
倾向值指的是被研究个体在控制可观察到的混杂变量的情况下,接受某种干预(治疗)的条件概率。PSM的精髓在于将众多可观察到的混杂变量整合成一个变量——倾向值,由于具有相同或相近倾向值的个体的其他变量在分布上具有相同的特征,故将处理组和对照组的个体根据倾向值进行匹配,从而平衡两组样本的基线数据(想一想,这不就达到类似随机分组的效果了吗?)。由于混杂变量在倾向值匹配的过程中被控制起来,两组结局上的差异就只能归因于干预措施的有无了。
下面我们以2006年发表在European Heart Journal上的一篇文章来简要介绍下1:1 PSM的原理和步骤。
研究背景及目的:长期使用利尿剂
对慢性心衰患者预后的影响
非保钾利尿剂由于有激活神经内分泌系统的作用,对慢性心衰患者的预后可能有害,该研究旨在探究长期使用利尿剂对慢性心衰患者预后的影响。
研究方法
研究人群:Digoxin Investigation Group (DIG)研究队列,共6067名患者入选(排除使用螺内酯和其他保钾利尿药者),应用PSM进行1:1配对,最后共纳入2782名患者进行分析,包括1391名利尿剂使用患者和1391名未使用利尿剂患者。
主要终点事件:全因死亡
次要终点事件:心衰相关死亡、全因再住院、心衰再住院
第1步:计算倾向值
运用多因素Logistic回归,以处理因素(是否接受利尿剂治疗)为因变量,以其他可观察到的基线变量为自变量来计算倾向值,作者同时考虑了自变量间的交互作用。
倾向值计算的过程中,选择自变量应注意以下几点:
(1)排除与处理因素有关,但与结局无关的变量
(2)排除可能由处理因素的施加而发生改变的变量
(3)排除可以完美预测处理因素的变量
(4)客观变量较主观变量在减小混杂方面更具优势
第2步:根据倾向值对处理组和对照组研究对象进行1:1的匹配,共2782名患者配对成功。
第3步:检查匹配后的基线是否平衡(在此之前可以列出匹配前的基线表,以便与匹配后的进行对比),作者用绝对标准化差值(Absolute Standardized Difference, ASD)来检查配对效果,ASD<10%提示变量在两组间平衡。可以看出,两组配对的效果较好,图中匹配后小方块都落在0-10%的区域内(图1)。
也可用t检验、秩和检验和卡方检验来评估配对后基线是否平衡。若匹配后两组间基线无统计学差异,则进行下一步分析;若匹配后仍发现两组间有关键变量不平衡,则返回第一步检查并调整Logistic方程中的变量。
第四步:保存匹配后的样本数据,运用Cox比例风险模型评估长期使用利尿剂对结局的影响。结果提示长期使用利尿剂可以增加心衰患者的全因死亡率、心衰相关死亡率、全因再住院率和心衰再住院率。
第五步:敏感性分析
观察性研究的短板之一是干预组和对照组在实施干预之前某些方面可能存在差异,这些差异会导致研究结果产生偏性。在这些差异中,能从现有的数据中观察到的偏差,称为显性偏差;未能观察到或记录下来的偏差,称为隐性偏差。与之相对应的,RCT对干预组和对照组研究对象的随机分配,能够平衡两组已知的、未知的基线特征,使得两组存在显性偏差或隐性偏差的概率很小。
PS的计算是基于可观察到的变量,即PS仅能修正显性偏差,而无法修正隐性偏差。因此,评价倾向值分析的结果对隐性偏差的敏感性显得非常重要。统计学家为此引入一个统计量 Γ(伽马)——隐性偏差将暴露比提高到原来的 Γ倍时分析结果发生质变。当 Γ很小,接近1时,提示较小的隐性偏差即可改变分析结果,那么该研究结论就是敏感的。如果需要 Γ的极值才能改变统计推论,那么该项研究就是不敏感的。该研究敏感性分析发现,隐性偏差仅需使暴露比增加12%即可改变结论,即结论对隐性偏差敏感。
研究结论
长期使用利尿剂可增加慢性心衰患者的远期死亡率,但该结论对隐性偏差敏感。(表1)
延伸阅读
倾向值分析的一个重要假设是强可忽略的干预分配。所谓强可忽略的干预分配,就是假设计算倾向评分的协变量包括了所有影响分组的混杂因素,即不存在未识别的混杂因素。或者说在现有观察变量条件下,处理因素的分配可以认为是随机的。在实际工作中,一般很难做到将所有混杂因素均包括在模型中。但如果研究者能够根据专业知识收集到尽可能全面的主要混杂因素,则倾向评分法的研究结果将非常近似随机对照研究的结果。
参考文献
1. Behav Res Ther. 2017. pii: S0005-7967(17)30014-1.[Epub ahead of print]
2. Eur Heart J. 2006,27:1431-9.
3. 胡安宁.《倾向值匹配与因果推论:方法论述评》.
4. 郭申阳.《倾向值分析:统计方法与应用》.
临床研究方法学精彩回顾
研究进展精彩回顾
关注医咖会,你会发现研究方法学没那么可怕
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。诚邀各位伙伴加入我们创作内容,请和小咖联系,和大家分享你喜爱的临床研究以及有用的研究方法学知识。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。